home *** CD-ROM | disk | FTP | other *** search
/ TPUG - Toronto PET Users Group / TPUG Users Group CD / TPUG Users Group CD.iso / PET / S-Super PET / (s)t7.d64 / WS.DESCRIPTION < prev   
Text File  |  2009-01-18  |  20KB  |  316 lines

  1.                       ASP : A STATISTICAL PACKAGE
  2.                       ===========================
  3.  
  4. The programs on this disk comprise a statistical analysis package. Complete
  5. documentation, sample problems etc. can be found in 'Computing in Statistical
  6. Science Through APL' by Francis Anscombe, published by Springer-Verlag,
  7. New York Inc. 1981.
  8. Two conventions should be noted:
  9. 1) Abcissas are always mentioned before ordinates (as with arguments of
  10.    'regrinit' and 'scatterplot').
  11. 2) When numerical vectors are stacked in a matrix, they are the columns
  12.    (as with the result of 'jacobi' and the argument of 'downplot'.
  13.                              * * * * *
  14. Let us look at the workspaces and ther contents.
  15. UTILITY:
  16.  enter: Enter data for storage in an array called matrix.
  17.  store: Save data to disk.
  18.  print: Print output to ieee4 printer.
  19.  test:  Test carriage control.
  20.  read:  Get file from disk.
  21.  listfile: List a disk file.
  22. MULT/REGR: Multiple regression by stages and examination of residuals.
  23.  x regrinit y: Is used once at the outset to setup global variables for 'regr'.
  24.     the first argument X is a matrix whose columns list values of the independ-
  25.     ent variables. Usually one column is all 1's and its index number is the
  26.     argument in the first call of 'regr'. Each column of X should have been
  27.     multiplied by powers of 10 so that the unit place is the last significant
  28.     one.  The second argument Y is either a vector listing values of one
  29.     dependent variable or a matrix whose columns list values of several
  30.     dependent variables.  Just as with X, the unit place should be the last
  31.     significant one.
  32.  regr l: performs regression on one or more designated independent variables.
  33.     The argument L is a scalar or vector listing the index no.(s) of the
  34.     independent variables(s) to be brought into the next regression.
  35.  show v: may be used at any stage to obtain summary information about a vector.
  36.     The argument V is a vector, such as RY (if a vector) or a column of RY
  37.     (if a matrix) or a column of RX or DIAGQ. The frequency distribution in the
  38.     output is over six intervals of equal length, The 1st and 6th are centered
  39.     on the least and greatest values occurring in V. 'show' refers to no global
  40.     variables, and may be used outside this regression context.
  41.  stres: gives standardized residuals of the dependent variable(s) for use in
  42.     scatterplots.  No arguments. Should be used only after 'regr' has been
  43.     executed.
  44.  variance: yields the conventional estimated variance matrix of the regression
  45.     coefficients.  No arguments, use only after 'regr' has been executed.
  46.  n sample cp: sample of size N from a distribution over non-negative integers
  47.     having cumulative probabilities CP
  48. APLTESTS: Tests on residuals after least squares linear regression.
  49.  test i: Tests for distribution shape, heteroscendasticity, nonadditivity, and
  50.     serial correlation, are carried out on residuals from a fitted regression
  51.     relation. Several Global variables from 'regr' are needed. Special cases
  52.     of the tests appear in 'rowcol' and 'summarize'. The argument I is either
  53.     1 or 2, controlling which subsidiary function is used for computing moments
  54.     of the test Statistics. (*This routine appears to be missing from the disk)
  55.  tests1: Calculates exact 2nd and third moments.
  56.  tests2: Calculates exact 2nd and approximate third moments.
  57.  ccd s: Carries out a complete cholesky decomposition.
  58. REG/PLOT
  59.  x cor y: Calculate correlation coefficient between vectors X and Y.
  60.  stdize x: The vector X is rescaled to have zero mean and unit variance.
  61.  rlogistic n: N random logistic deviates, mean 0, variance 1.
  62.  rnormal n: N random normal deviates by box-muller method.
  63.  p quantiles v: Quantiles of the vector V for given proportions P
  64.  x fit y: Causes information to be displayed about the means of the variable and
  65.     the regression coefficient, together with a conventional estimated standard
  66.     error for the latter, calculated as though the errors were independent.
  67.  nif x: Gives the hastings approximation to the normal integral function.
  68.     X may be any numerical array.
  69.  u scatterplot v: Used for displaying corresponding members of two vectors.
  70.     U and V are vectors of equal length. Corresponding members U[j] and V[j]
  71.     are ploted as abscissa and ordinate of a a point.
  72.  u tscp v: A tripple scatterplot in which a third dimension is suggested by
  73.     varying the symbols used in plotting the points.
  74.  downplot v: Is used for plotting members of one or more vectors against their
  75.     index numbers. The argument V is either a vector or a matrix, if V is a
  76.     vector, V[j] is plotted against j.  Otherwise, V[j:] is plotted against j.
  77.  z tdp v: a tripple downplot in which the third dimension is suggested by
  78.     varying the symbols used in plotting the points. The Z argument is a
  79.     character scaler or vector or matrix, indicating the symbols to be used in
  80.     plotting the points. if z is scalar, the same symbol is used every time.
  81. TABLES
  82.  summarize y: Provides summary statistics of a data set. The argument Y may
  83.     be any numerical array having at least 4 members. Measures of location,
  84.     scale, shape of distribution are displayed.
  85.  rowcol y: performs a standard analysis of variance on row-column cross-
  86.     classification, along with an additive analysis of a two-way table, with
  87.     tests on residuals.
  88.  rowcolpermute: permutes global variables RE CE and RY, use after 'rowcol' and
  89.     before 'rowcoldisplay'. Puts CE in ascending and RE in descending order.
  90.  rowcoldisplay i: Is a special function  substituting for 'tscp', that may be
  91.     used to display the output of 'rowcol'. Abcissas and ordinates are the
  92.     column effects and the row effects. The argument I is the change in column
  93.     effect represented by a unit horizontal displacement.
  94.  analyze y: Begins the analysis of variance of a perfect rectangular array.
  95.  effect v: Estimates a designated main effect or a designated interaction.
  96.     The argument V is a list of one or more coordinate numbers, just one for a
  97.     main effect, two or more for an interaction.
  98.  mp x: This routine, median polish, fits an additive structure to a two-way
  99.     table by repeatably subtracting medians of rows and medians of columns.
  100.  n bartlett s: Bartlett's test for homogeneity of variances. The second
  101.     argument is a vector of unbiased variance estimates.  The first argument
  102.     is the degrees of freedom, either the common value for all the variance
  103.     estimates or a vector of values, one for each variance estimate. Box's
  104.     approximation by the f distribution and Bartlett's original chi-square
  105.     approximation.
  106. CONTINGENCY: Analysis of contingency tables.
  107.  contingency x: Applies to two dimensional contingency tables and performs a
  108.     chi-square test of association, with display of standard residuals. The
  109.     argument X must be a matrix of non-negative numbers, having no zero marginal
  110.     totals.
  111.  fourfold x: Also applies to two dimensional tables and is applied when the
  112.     categories of each classification are ordered.  Empirical log crossproduct
  113.     (fourfold) ratios are displayed. A Plackett distribution is fitted and
  114.     goodness of fit is tested by chi-squared, with display of standardized
  115.     residuals. The argument X is the same as in 'contingency'.
  116.  multipoly x: Applies to contingency tables in any number of dimensions finding
  117.     empirical log crossproduct ratios analagous to those of 'fourfold' for two
  118.     dimensions. The argument X must be an array of non-negative integers in 2
  119.     or more dimensions.
  120.  v pool x: Also applies to multi-dimensional arrays, pooling categories in any
  121.     table. The second argument X is an array in 2 or more dimensions, typically
  122.     a contingency table or a table of expected frequencies.  The first argument
  123.     V is a vector with at least 3 elements. V[1] specifies the coordinate and
  124.     1(down arrow)V specifies the index values, over which there is to be
  125.     pooling. Sections of X corresponding to index values 2(down arrow)X are
  126.     added to the section with index value v[2], and then the former sections
  127.     are deleted. Thus if X is a matrix with 5 rows and V is 1 4 5 1 , pooling
  128.     will be over the 1st coordinate (rows); The contents of rows 4 5 and 1 will
  129.     be added, placed in row 4 and the rows 5 and 1 will be dropped, so the
  130.     result Y has three rows.
  131.  lfact x: Calculates the factorials of X.
  132.  n csif x: The tabulated chi-squared integral function.
  133.  inif p: Odeh-evans approximation to the inverse of the normal integral function
  134.  ctg2 x: A function similar to 'contingency' except that the probability-of-the-
  135.     sample statistic and also the likelihood-ratio statistic are calculated
  136.     instead of Pearson's chi squared. Calls 'lfact', 'csif' and 'inif'.
  137. FUNCTIONS
  138.  x max y: Maximization of a function of one variable. The arguments are vectors
  139.     of length 3, the first having no two members equal.  The explicit result is
  140.     the coordinates of the vertex of a parabola with vertical axis, that goes
  141.     through  the three points whose abscissas are the first argument and
  142.     ordinates the second argument.
  143.  h integrate a: Integration of one dimensional definite integrals. The first
  144.     argument H, a scalar, is step size.  The second argument A is a vector
  145.     of 2 or limits of integration, in ascending order, with differences all
  146.     divisible by H.  The explicit result Z is a vector of length 1 less than
  147.     the length of A, listing the definite integrals from A[1] to each of the
  148.     other members of A.  The function to be integrated is asked for, and must
  149.     be expressed in terms of an argument X(local variable). For example, to
  150.     integrate 'sin x' from 0 to each of 1 2 3 and compare the result with
  151.     '1 - cos x': 0.1 integrate -1+1 2 3 4 then enter 1ox and 1-2o1 2 3
  152.  inif p: See 'CONTINGENCY'
  153.  nif x:  See 'REG/PLOT'
  154. TIME:
  155.  cw r: Calculates weights for a cosine-weighted moving average of length R.
  156.  m filter x: For filtering time series.  The first argument M is a pair of
  157.     integers defining the filter.  The second argument X is a vector of data to
  158.     be filtered.  Filtering consists of subtracting a cosine-weighted moving
  159.     average of extent M[2] from a similar moving average of extent M[1]. The
  160.     resulting weights are displayed, together with their sum of squares. The
  161.     elements of M must be either both odd or both even, or else one of them
  162.     must be 0.
  163.  w mav x: Moving average or filtering of a series X with weights W.  A moving
  164.     average with arbitrary weights is taken of either one vector or several
  165.     vectors simultaneously.  The first argument W is the vector of weights.
  166.     The second argument X is either a vector of data or a matrix whose columns
  167.     are the vectors of data to be averaged. The result U is either a vector or a
  168.     matrix.
  169.  k taper u: Fourier analysis of time series.  The first argument K is a positive
  170.     integer and the scond U is a vector of length greater tha 2xK.
  171.  d fft v: Fast Fourier transform. The first argument D is scalar, either 0 1 or
  172.     2. The second argument V is a three dimensional array. If D is 0, the
  173.     function yields the complex Fourier transform of a single complex time
  174.     series. if D is 1, the function yields the real Fourier transform of a
  175.     single real series; the transform is scaled to give a direct analysis of
  176.     variance.  When D is 2 the function yields simultaneously the real trans-
  177.     forms of two real series, each scaled as when D is 1.
  178.  polar s: Is used to transform the output of 'fft' to polar form.  The argument
  179.     S is a matrix with 2 columns, such as the result of 'fft' when D is 1.
  180.  w ma x: Moving average or filtering of a series X with weights W.
  181.  *** The next five routines carry out a harmonic regression of a time series
  182.      on one or more other time series.
  183.  prehar: Generates phase-difference plots between pairs of series. The data is
  184.      passed to 'prehar' in the global variable FT, a three dimensional array.
  185.  harinit u: Initializes for the remaining functions.
  186.  b har1 v: Performs harmonic regression of a dependent series on one predictor
  187.      series.
  188.  b har1r v: Generates the residual series after execution of 'har1'.
  189.  b har2 v: Performs harmonic regression of a dependent series on two predictor
  190.      series.
  191.  tsnt u: Carries out a normality test on a time series. The argument is a vector
  192.      of innovations.
  193.  mardia x: Mardia's multivariate kurtosis test.
  194.  end : Invoked by 'tsnt' and 'mardia'
  195. GAIN
  196.  f gain w: Gain of a linear filter. If the weights are symmetric, the lag is
  197.      taken to be constant, equal to 0.5x-1+pw, and the gain may be negative.
  198.      if the weights are unsymetric the lag is not computed and g is merely
  199.      the magnitude of the gain.
  200.  f gainlag w: Is used to calculate lag and gain when W is not symmetric.  F is
  201.      supposed to be in increasing order, and the gain should not vanish at any
  202.      member of F; 'gain' may be run to verify this.  Consecutive members of F
  203.      should be close enough together for phase changes to be small.
  204.  n autocov v: Calculates the first N serial correlations of V.
  205.  x fit y: See REG/PLOT
  206. PLACKETT
  207.  p1 pd2 p2: The explicit result is a two dimensional plackett distribution
  208.      having discrete marginal distributions with probabilities listed in the
  209.      arguments. Each argument must consist of at least two positive integers
  210.      summing to 1. One global variable must be defined before execution, the
  211.      natural logarithm of the fourfold crossproduct ratio of probabilities.
  212.  pd3: Requires 7 global variables to be defined before execution: P1, P2 and
  213.      P3 list probabilities in the discrete univariate marginal distributions;
  214.      L12, L13 and L23 give the log fourfold ratios in the bivariate marginal
  215.      distributions; TOL is a positive tolerance such as 0.001.
  216.  x biv y: Invoked by 'pd2' and 'pd3'.
  217.  a pp b: Finds the product of two polynomials.
  218.  collect a: Used with 'pp'; collects like terms in a polynomial.
  219.  n isotropy l: Test of sphericity of a multivariate normal distribution. The
  220.      first argument N is the number of degrees of freedom in the variance
  221.      matrix.  The second argument L is a vector of positive roots of the
  222.      variance matrix.
  223.  c jacobi x: Characteristic roots and vectors of a symetric matrix. The second
  224.      argument X is the given matrix, to be transformed towards diagonal form by
  225.      Jacobi's method.  The first argument C, a positive scalar, is the tolerance
  226.      for off-diagonal elements in the transformed matrix.
  227. REG7: Regression when errors have a type 7 (or 2) distribution.
  228.  t7init: Initializes.
  229.  t7lf k: Evaluates the marginal likelihood function L at a trial set of values
  230.      of the regression parameters, after integration of the likelihood with
  231.      respect to the scale parameter and the shape parameter. The argument K
  232.      specifies the order of derivatives needed, 0 for L, 1 for L and DL, 2 for
  233.      L, DL,and D2L. The argument should be 2 at first execution.
  234.  t7s q: Estimates the change in the regression parameters needed to reach the
  235.      maximum of the marginal likelihood.  The argument Q should be not less
  236.      than 3/n.
  237.  t7a: Invoked by 't7lf'.
  238.  t7b: Invoked by 't7lf'.
  239. HOUSEHOLDER: Regression by Householder tranformations, uncorrelated residuals.
  240.  x hht y: Arguments as per 'regrinit', except that the last significant digit in
  241.      all columns of X that have observational error should be in the same place,
  242.      but not necessarily in the unit place.
  243. HUBER: Robust regression
  244.  r huber z: The function 'huber' performs one cycle of iteration towards
  245.      minimizing the sum of a function rho of the residuals in a regression
  246.      problem, where rho is defined in terms of a positive constant K.
  247.      The first argument R must be scalar and either -1 or between 0 and 1.
  248.      The second argument Z is the array of residuals corresponding to a trial
  249.      setting of the regression parameter 'beta', which must be pre-specified.
  250.  huber1: Is invoked when Z is a vector.  There must be a global matrix X whose
  251.      columns are the independent variables in a regression.
  252.  huber2: Is invoked when z is a matrix.  Z must have at least 3 rows and 3
  253.      columns.  The usual additive structure is fitted.
  254. ASPDATA: Contains various test files used in the book.
  255.  print: Prints a variable: i.e. print varname.
  256.  enter: As in UTILITY.
  257.  **** list of variables in 'aspdata'
  258.  loblollydata: Average heights of loblolly pines in feet.
  259.  enrol: Enrolment at yale university 1796-1975.
  260.  imports: Imports of merchandise 1790-1975.
  261.  year: a list of year numbers 1796 to 1975.
  262.  butter: Wholesale price of butter at New York (cents/pound) 1830-1975.
  263.  housing: Total nember of new housing units started (thousands) 1889-1975.
  264.  se70: School expenditures , 51 points of data, one for each state.
  265.  pi68: Personal incomes, 51 points of data, one for each state.
  266.  y69: Young persons, same as 'se70'.
  267.  urban70: Proportion urban population, same as 'se70'.
  268.  m1: White-Eisenberg table, stomach cancer site and blood group.
  269.  m2: Graunt table, sex of christenings in london and country.
  270.  m3: francis table, summary of 1954 poliomyelitis vaccine trial.
  271.  m4: Kiser-Whelpton table, education of wife and fertility planning.
  272.  m5: Gilby table, clothing and intelligence rating of schoolboys.
  273.  m6: Stuart table, men's distance vision in right and left eyes.
  274.  m7: Glass table, social mobility, father's status and son's status.
  275.  y349: A matrix of values on page 349.
  276.  x350: A matrix of values on page 350.
  277.  num: scalar=80;   rec: scalar=81;  vars: vector=80 1; vector: scalar=60
  278. **************************** GENERAL COMMENTS ***********************
  279. The Functions described above work together using many global variables.
  280. However, it appears that they can be organized into three groupings; namely
  281. 1) analyze      cor          downplot       effect      fit        quantiles
  282.    regr         regrinit     rowcol         rowcoldisplay          rowcolpermute
  283.    scatterplot  show         stdize         stres       summarize  variance
  284. 2) autocov      contingency  cw             fft         filter     fourfold
  285.    harinit      har1         har1r          har2        huber      huber1
  286.    huber2       ma           mav            multipoly   polar      pool
  287.    prehar       taper        tdp            tscp
  288. 3) bartlett     biv          ccd            collect     csif       ctg2
  289.    end          gain         gainlag        hht         inif       integrate
  290.    isotropy     jacobi       lfact          mardia      max        mp
  291.    nif          pd2          pd3            pp          rlogic     rnormal
  292.    sample       tests        tests1         tests2      tsnt       t7a
  293.    t7b          t7init       t7lf           t7s
  294. as the author stored them in three seperate workspaces on his system.
  295.                              * * * * *
  296. print/basic: This is a Waterloo basic program to print an apl data file.
  297.  
  298.                              * * * * *
  299. DISCLAIMER:
  300.  This Waterloo text file has been added to this disk for your use and
  301.  as encouragement to try the statistical functions.
  302.  I am not a statistician and it is quite possible I have misinterpreted
  303.  the meaning or significance of some function or variable.
  304.                                       Bill Dutfield
  305.                                        November 11/83
  306.                              * * * * *
  307. A THANK YOU!
  308.  I did not enter the apl functions and I would like to thank that person
  309.  (unknown to me) who did.  The effort he put into entering and checking these
  310.  functions was time consuming, but I believe worthwhile not only for himself
  311.  but for us. I would like to thank Roger Green for bringing them to the
  312.  attention of the club and for making them available to us, the Superpet
  313.  group of TPUG (Toronto Pet Users Group).
  314.                       ***** End of File *****
  315.  
  316.